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Рассматриваются взвешенная и невзвешенная задачи нахож- 
дения минимального покрытия множеств, а также ее приме- 
нимость для решения важнейших оптимизационных практи- 
ческих задач, таких как размещение пунктов обслуживания, 
назначение экипажей на транспорте, проектирование инте- 
гральных схем и конвейерных линий. Цель статьи — описание 
методов повышения эффективности решения данной задачи. 
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Сформулирован принцип работы генетического алгоритма и 
возможность использования его модификации в качестве ме- 
тода решения задачи покрытия множеств. Рассматривается 
жадная стратегия Хватала для решения задачи покрытия. Для 
решения задач небольшого размера разработан алгоритм пол- 
ного перебора в качестве точного алгоритма. Описан модифи- 
цированный генетический алгоритм, разработанный Нгуеном 
М. Х. Создано программное средство для сравнения произво- 
дительности этих алгоритмов. Сделаны выводы о том, что 
решение задачи покрытия множеств разработанной модифи- 
кацией генетического алгоритма более эффективно, чем гене- 
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тическим алгоритмом Нгуена М. Х. и жадной стратегией, 
причем в задачах небольшого размера полученные результаты 
отличаются небольшой погрешностью. 
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Введение. Задача о покрытии множества является классическим вопросом информатики и теории сложности. 
Данная задача обобщает МР-полную задачу о вершинном покрытии (и потому также является МР-сложной). 

К задаче о покрытии можно свести многие задачи дискретной оптимизации: стандартизации, упаковки и раз- 
биения множества, построения расписаний. Известна также и обратная сводимость задачи о покрытии к этим задачам. 

На практике задачи о покрытии возникают при размещении пунктов обслуживания, в системах информацион- 
ного поиска, при назначении экипажей на транспорте, проектировании интегральных схем и конвейерных линий ит. д. 


Постановка задачи. Дано множество И из и элементов, и набор подмножеств (0, 5 = {51,..., 9. Каждому 
подмножеству $; сопоставлена некоторая неотрицательная стоимость с: 5 —> О*. 5' < 5 является покрытием, если лю- 
бой элемент из И принадлежит хотя бы одному элементу из 5' [1]. 

Задача о покрытии множествами заключается в нахождении набора подмножеств, покрывающего все множе- 
ство И и имеющего минимально возможный вес (в случае взвешенной задачи) или минимально возможное число 
подмножеств (в случае невзвешенной задачи). 

Для упрощения понимания задачи рассмотрим следующий пример. Необходимо собрать команду специали- 
стов для корабля. Члены команды должны обладать в совокупности всеми требуемыми навыками, но количество чле- 
нов команды должно быть минимальным. Это невзвешенная задача покрытия, т. е. «вес» каждого члена группы оди- 
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наков и поэтому не важен. Если же каждому члену команды поставить в соответствие какую-то величину (вес), 
например, опыт работы, то задача станет взвешенной. 

Можно представить задачу в матричном виде [2]. Пусть А=(а,) — произвольная матрица размера т х п с эле- 
ментами ау Е [0,1] без нулевых строк и столбцов. Будем говорить, что в А строка { покрывается столбцом }, если а; =1. 
Подмножество столбцов называется покрытием, если в совокупности они покрывают все строки матрицы А. Пусть 
каждому столбцу поставлено в соответствие положительное число с, называемое весом столбца. Требуется найти по- 
крытие минимального суммарного веса. Вводя переменные х,, равные 1, если столбец ] входит в искомое покрытие, и 
равные 0 в противном случае, приходим к следующей формулировке задачи о покрытии: 

Ш ь 
ры Хх, > Ш, 
при ограничениях 
Ш 
уз азх; > =У,...т,х, Е {0,1}, 1 =1,..., п. 
1+ 

Обзор алгоритмов решения. Для решения задачи покрытия множеств разработано множество алгоритмов, 
которые можно разделить на следующие классы: приближенные алгоритмы с априорной оценкой, эвристические ал- 
горитмы, точные алгоритмы [3]. 

Одним из первых приближенных алгоритмов является жадный алгоритм. Для задачи о покрытии с произволь- 
ными весами В. Хватал предложил модификацию жадного алгоритма. Поскольку эвристики носят вероятностный ха- 
рактер, их сложность невозможно оценить априорно. К ним можно отнести методы лагранжевой релаксации, генети- 
ческие алгоритмы, поиск с запретами, алгоритмы муравьиной колонии, нейронные сети. Примером точных алгорит- 
мов служит метод ветвей и границ. 

В данной статье авторы рассматривают жадный алгоритма Хватала, модифицированную модель Голдберга 
генетического алгоритма и эвристику, разработанную Нгуеном М. Х. Кроме того, показано, насколько результаты 
работы модифицированной модели Голдберга близки к точному решению, полученному с помощью алгоритма точно- 
го перебора. 

Жадный алгоритм. В 1979 году В. Хватал предложил жадный алгоритм для задачи о покрытии множествами 
[4, 5]. 

Алгоритм Хватала (И, 5, с: 5 —* О’): 

Се 9, 591 < 9; 

2) У\Ше С = 0 90: 

Найти 5; 5 — 501, у которого 
а;=с(5)/5; - С минимально. 

$01 < 501 {5}. 

С СЦ5, ($, — самое эффективное), 
рисе(е) = в; для всех ее 5;- С. 

3) ОшриЕ (501. 

Рассмотрим принцип работы этого алгоритма. На каждой итерации выбираем самое эффективное множество, 
удаляем покрытые элементы и продолжаем до тех пор, пока не будут покрыты все элементы. Пусть С — это множе- 
ство элементов, уже покрытых на предыдущих итерациях. Для каждого множества 5; определим его эффективность 
как а;=с(5)Л5--С1. Эффективность множества равна средней стоимости, с которой покрываются элементы этого мно- 
жества, еще не покрытые на предыдущих итерациях. 

Генетический алгоритм. Общая схема работы. Предложенные в 1975 году Джоном Холландом генетиче- 
ские алгоритмы (ГА) основаны на принципах естественного отбора и наследования и относятся к стохастическим ме- 
тодам [6-9]. Эти алгоритмы успешно применяются в различных областях деятельности (экономика, физика, техниче- 
ские науки и т. п.), их используют для решения многих оптимизационных задач. На рис. 1 представлена общая схема 
работы ГА. 

Применение генетического алгоритма для решения задачи покрытия множеств. Представленная схема 
является общим алгоритмом для решения многих задач, и при применении её к конкретной задаче необходимо вы- 
брать механизм кодирования параметров в гены особи, оптимизационную функцию, условие останова [1]. Авторы 
модифицировали модель Голдберга и применили ее для решения задачи покрытия множеств. В данном случае опти- 
мизационной функцией будет являться минимизация веса покрытия, а условием останова будет неизменность лучше- 
го решения в течение заданного числа поколений. 
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Рассмотрим механизм кодирования особи. Каждый ИНДИВИД К представлен хромосомой, являющейся п- 
мерным вектором ж у которого ]-Й элемент х принимает значение 1, если подмножество 5, входит в Покрытие, и при- 
нимает значение 0, если иначе. 


НАЧАЛО 


Инициализация — 
выбор исходной популяции 


Оценивание приспособленностей особей в 
популяции 


Условие завершения 
выполнено? 









Селекция особей Выбор наилучшей особи 


Применение генетических 
операторов 
Создание новой популяции 






Рис. 1. Общая схема ГА 


С таким представлением степень приспособленности №№ индивида р может быть рассчитана следующим обра- 
зом: 


ш к 
Л = хил 
= 


где с; — стоимость подмножества 5,. 
Таким образом, оптимизационная функция выглядит как }, —> шш. 


Для выбора родительских особей используется случайный отбор. В алгоритме используется тип мутации, ос- 
нованный на изменении случайного гена на противоположное значение. Оператор скрещивания точечный. Выбира- 
ются пары хромосом из родительской популяции. Далее для каждой пары отобранных таким образом родителей 
разыгрывается позиция гена (локус) в хромосоме, определяющая так называемую точку скрещивания — [. В резуль- 
тате скрещивания пары родительских хромосом получается следующая пара потомков: Р1 — потомок, хромосома 
которого на позициях от 1 до [х состоит из генов первого родителя, а на позициях от [+ +1 до Ё — из генов второго ро- 
дителя; Р2 — потомок, хромосома которого на позициях от 1 до [, состоит из генов второго родителя, а на позициях 
от { +1 до Ё — из генов первого родителя. 

Начальное поколение состоит из особей, сформированных случайно с помощью алгоритма, подобному жад- 
ному алгоритму. 

Очень важная деталь работы генетического алгоритма в том, что при скрещивании и мутации могут появить- 
ся особи, соответствующие покрытия которых не существуют, то есть получаются недопустимые решения. Алгоритм 
проверяет, существует ли покрытие, и если нет, то пытается, в случае скрещивания, выбрать другую вторую роди- 
тельскую особь, а в случае мутации — выбрать другой ген для его инвертирования. Если и это не «исправит» особь, 
родитель выбирается заново случайным образом. Потомок заменяет случайно выбранную особь, если его приспособ- 
ленность выше. 

Рассмотрим на примере, как работает генетический алгоритм и как он избавляется от недопустимых решений. 
Задача представлена в виде матрицы размером 10х10, заполненной "0" и "1". Столбцы матрицы — это подмножества 
множества И, а строки — элемента множества И. Таким образом, множество И = {х%,...,Хо], и оно состоит из 10 под- 
множеств 5=/50,..., 59]. "1" в матрице обозначает, что соответствующее столбцу подмножество покрывает соответ- 
ствующий строке элемент. Не будем учитывать веса подмножеств, т. е. задача невзвешенная. 
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Рис. 2 Матрица подмножеств исходного множества 


Используем для поиска покрытия наименьшей мощности ГА с 10 особями. 
Каждая особь соответствует определенному покрытию, поэтому длина особи равна 10 и каждый ген 
Сй=/Сй,..., Со} соответствует определенному подмножеству. Если ген особи равен "1", то подмножество входит в 


покрытие, если "0", то не входит. 


На начальном шаге алгоритма особи формируются случайным образом. Представим особи и их гены в виде 
массива, где строка — особь, столбец — ген особи. 




































































особь 0 1 1 1 0 0 0 0 0 0 0 
особь 1 1 0 0 0 1 0 0 0 0 1 
особь 2 1 0 0 1 0 1 0 0 0 1 
особь 3 1 1 1 0 0 0 0 1 0 0 
особь 4 0 0 0 1 1 0 1 0 0 0 
особь 5 1 0 0 1 1 0 0 0 0 0 
особь 6 0 0 0 0 0 0 0 0 0 0 
особь 7 1 0 1 0 0 1 0 1 0 1 
особь 8 0 0 0 1 1 0 1 1 0 0 
особь 9 1 1 1 0 0 1 0 0 1 0 
Сю Сы С С Сы С Се С С Сю 


Рис. 3 Формирования начальной популяции 


На следующем шаге случайно выбрана родительская особь "1". С некоторой вероятностью к ней применяется 
оператор одноточечного скрещивания, поэтому случайно выбирается вторая родительская особь "2". Точка скрещива- 
ния = ген №3. После скрещивания получаем потомка: 
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Но такого покрытия не существует, алгоритм пытается 


гой ген, выбран ген №2. Особь-потомок: 
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Такое покрытие существует. Далее в поколении случайно выбирается особь №9, которую, возможно, заменит пото- 


МОК. Приспособленность потомка равная 4 выше приспособленности особи №9 равной 5, поэтому он ее заменяет. 


Все описанные шаги выбора родительских особей и применения к ним операторов скрещивания и мутации 


повторяются, пока не будет найдено решение. Алгоритм заканчивает свою работу, если решение не может быть 


улучшено за заданное число поколений. 
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Модификация генетического алгоритма Нгуена Минь Ханга. В статье [10] Нгуен Минь Ханг показал свой 
подход к решению задачи покрытия множеств, основанный на генетическом алгоритме. Особенностью данного под- 
хода является использование модифицированной для задачи покрытия классической модели ГА. Для выбора роди- 
тельских пар используется метод пропорционального отбора. Каждой особи ставится в соответствие вероятность вы- 
бора этой особи, рассчитанная по ее эффективности. Разработан новый оператор кроссовера, суть которого в том, что 
соответствующий ген для особи-потомка определяется в зависимости от степени приспособленности родителя и от 
частоты появления этого гена в популяции. Кроме того, используется переменная частота мутации. При применении 
операторов кроссовера и мутации над индивидами допустимость решения может быть нарушена (т. е. полученный 
набор не является покрытием множества). Для устранения этого явления предлагается эвристический алгоритм вос- 
становления допустимости решения, одновременно являющийся локальным оптимизационным шагом для увеличения 
общей эффективности генетического алгоритма. 

Анализ производительности алгоритмов. Исследуем вопрос, какой алгоритм получает более точные реше- 
ния, Голдберга или Нгуена М. Х. В целях сравнения эффективности этих алгоритмов по весам найденных покрытий и 
временным затратам было разработано программное средство на языке С#. Представлены результаты экспериментов 
на ПК следующей конфигурации: ОС Мсгозой Итаом5 10 Рто х64, процессор ПиеЦК) Соге(ТМ) 15-2500К СРИ 
3.30СН», оперативная память 6 Гб. Было проведено по 100 экспериментов с различными матрицами размером ихт, 
где п — количество подмножеств множества И, т — мощность (количество элементов) множества И. Матрицы за- 
полняются случайным образом "0" и "1". 

® — Коэффициент заполненности матрицы подмножеств единицами р=0.5. 

® —_ Интервал распределения весов подмножеств для взвешенной задачи 1...200 (целые числа), формируются 
случайным образом. 

® Количество подмножеств и количество элементов множества И принимает значения 30х30, 50х50, 
100х100, 150х150, 200х200 

Приведены результаты сравнения модели Голдберга с различным числом особей (50, 100, 150, 200), жадного 
алгоритма Хватала и эвристики Нгуена М. Х. (50, 100, 150, 200 особей). Параметры для ГА были заданы следующие: 

» — вероятность скрещивания = 1, 

® — вероятность мутации = 1, 

® — условие останова =100 поколений, 

® — тип оператора скрещивания — одноточечное, 

® — ТИП мутации — одноточечная. 

Результаты сравнения алгоритмов для взвешенной задачи по весам покрытий представлены в таблице 1, по 
времени работы — в таблице 2, для невзвешенной задачи — в таблицах 3 и 4 соответственно. 


Таблица 1 
Веса покрытий (взвешенная задача) 


ГА Нгуен150 89,78 65,71 49,44 41,97 40,21 
ГА 200 87,05 62,83 46,22 38,35 30,74 
ГА Нгуен200 88,94 65,57 49,54 41,47 38,81 


ГА 150 87.22 62,76 45,93 38,95 31,25 
98,14 74,56 70,66 91.99 110,24 
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Таблица 2 
Временные затраты работы алгоритмов в мс (взвешенная задача) 


Алгоритм 30х30 50х50 100х100 150х150 200х200 


Таблица 3 





Веса покрытий (невзвешенная задача) 


Таблица 4 





Временные затраты работы алгоритмов в мс (невзвешенная задача) 


Алгоритм полного перебора (брутфорс). Полный перебор (Буше рюгсе) — метод решения математических 
задач. Относится к классу методов поиска решения исчерпыванием всевозможных вариантов. Сложность полного 





перебора зависит от количества всех возможных решений задачи. 

Любая задача из класса МР может быть решена полным перебором. При этом, даже если вычисление целевой 
функции от каждого конкретного возможного решения задачи может быть осуществлено за полиномиальное время, в 
зависимости от количества всех возможных решений полный перебор может потребовать экспоненциального време- 
ни работы. 


Коновалов И. С. и др. Применение генетического алгоритма для решения задачи покрытия множеств 





Суть алгоритма полного перебора для решения задачи покрытия заключается в переборе всех возможных со- 
четаний разной длины подмножеств исходного множества и, если очередное сочетание является покрытием и его вес 
минимален, необходимости сохранить его. Из теории множеств известно, что число всех подмножеств множества 
из п элементов равно 2". Другими словами 

> се =2”. 
=0 

Итак, чтобы получить точное решение задачи размерности 25х25, пришлось перебрать 2?°=33554432 вариан- 
тов, для этого потребовалось около 2-3 часов, но задача немного большей размерности 30х30 включает 
230=1073741824 вариантов, что уже затруднительно для расчетов. 

Для ускорения полного перебора программное средство было модифицировано для распараллеливания вы- 
числений с помощью многопоточности. 

Решения, полученные модификацией модели Голдберга с 200 особями, были сравнены с точными решениями, 
полученными брутфорсом, в задачах размерности до 25х25. Усредненные результаты по 100 экспериментам взвешен- 
ной задачи приведены в таблице 5. 











Таблица 5 
Веса покрытий точного решения и ГА 
пхт ГА Точное решение 
20х20 108,01 107,95 
25х25 88,94 88,02 

















Заключение. Проведено сравнение производительности различных алгоритмов применительно к взвешенной 
и невзвешенной задачам покрытия множеств. Обе модификации генетического алгоритма намного превосходят жад- 
ный алгоритм по весовым показателям получившихся покрытий, но по параметру трудоемкости жадный алгоритм 
выигрывает с огромным отрывом. Если важна скорость вычислений, то в задачах небольшой размерности можно ис- 
пользовать жадный алгоритм. Чем больше особей в поколении использует ГА, тем лучше результат весов покрытий. 
ГА с 200 особями лучший из рассмотренных. Но, естественно, чем больше особей, тем дольше работает алгоритм. По 
сравнению с эвристикой Нгуена М. Х. модифицированная модель Голдберга показывает лучшие результаты, что бо- 
лее заметно в задачах большой размерности, но при этом она использует больше временных ресурсов, ведь операторы 
скрещивания и мутации с вероятностью 100% применяются для всех особей поколения поочередно, в отличие от ме- 
ханизма Нгуена М. Х. Кроме того, в задачах небольшой размерности ГА на основе модели Голдберга получает реше- 
ния, очень близкие к точным. 
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